Étude et traitement automatique de l'anglais du XVIIe siècle : outils morphosyntaxiques et dictionnaires

نویسندگان

  • Odile Piton
  • Hélène Pignot
چکیده

RÉSUMÉ. Après avoir exposé la constitution du corpus, nous recensons les principales différences ou particularités linguistiques de la langue anglaise du XVII siècle, les analysons du point de vue morphologique et syntaxique et proposons des équivalents en anglais contemporain (AC). Nous montrons comment nous pouvons effectuer une transcription automatique de textes anglais du XVII siècle en anglais moderne, en combinant l’utilisation de dictionnaires électroniques avec des règles de transcriptions implémentées sous forme de transducteurs. ABSTRACT. In this article, we record the main linguistic differences or singularities of 17 century English, analyse them morphologically and syntactically and propose equivalent forms in contemporary English. We show how 17 century texts may be transcribed into modern English, combining the use of electronic dictionaries with rules of transcription implemented as transducers.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Stratégies pour l'étiquetage et l'analyse syntaxique statistique de phénomènes difficiles en français : études de cas avec Talismane

RÉSUMÉ. Les outils statistiques robustes en TAL, tels que les étiqueteurs morphosyntaxiques et les analyseurs syntaxiques, utilisent souvent des descripteurs « pauvres », qui peuvent être appliqués facilement à n’importe quelle langue, mais ne prennent pas en compte les particularités de la langue. Dans cette étude, nous cherchons à améliorer l’analyse de deux phénomènes en français en injectan...

متن کامل

Indexation multimédia par dictionnaires visuels en environnement décentralisé. Une approche par protocoles Gossip

RÉSUMÉ. Pour permettre la recherche par le contenu de documents multimédia repartis sur de larges réseaux, nous proposons un système d’indexation basé sur l’apprentissage décentralisé et asynchrone de dictionnaires visuels. Nous proposons un algorithme décentralisé pour le calcul des dictionnaires basé sur un protocole d’agrégation Gossip, qui produit un dictionnaire local performant en chaque ...

متن کامل

Multi-catégorisation de textes juridiques et retour de pertinence

Résumé. La fouille de données textuelles constitue un champ majeur du traitement automatique des données. Une large variété de conférences, comme TREC, lui sont consacrées. Dans cette étude, nous nous intéressons à la fouille de textes juridiques, dans l’objectif est le classement automatique de ces textes. Nous utilisons des outils d’analyses linguistiques (extraction de terminologie) dans le ...

متن کامل

A Methodology for semi-automatic structuring of a bilingual lexicographical corpus: the French-Kabyle case (Méthodologie pour la structuration semi-automatique du corpus dans une perspective de traitement automatique des langues : le cas du dictionnaire français-kabyle) [in French]

Résumé L’objectif de cette contribution est de proposer une méthodologie nouvelle de structuration de corpus à l’aide d’outils informatiques récents permettant aux linguistes non-spécialistes en informatique de constituer des corpus structurés en vue de leur exploration par des outils de traitement automatique des langues naturelles. Il s’agit, plus exactement, de présenter le processus d’infor...

متن کامل

Example-based NLP for Minority Languages: Tasks, Resources and Tools

Dans cet exposé nous analysons la relation entre le traitement automatique des langues minoritaires et les approches au Traitement des Langues Naturelles. Nous donnons un apperçu des tâches qui ont été affrontées et des approches utilisées. Vu que les ressources linguistiques sont limitées (telles que les dictionnaires et les corpus), le MLP emploie souvent des approches basées sur des règles, ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • CoRR

دوره abs/1002.0478  شماره 

صفحات  -

تاریخ انتشار 2009